Distribution statistique des trajets entre le domicile et le travail
Séminaire lunch de lâOFCE
lundi 13 mars 2023
Pourquoi MEAPS�
Modèle Ergodique à Absorption, Priorité et Saturation
Simulations Synthétiques
Estimations
Conclusions
Dans la modélisation des flux de personnes, par exemple, le modèle à 4 étapes est généralement utilisé.
Nous nous intéressons ici surtout à lâétape 2.
Un modèle couramment utilisé est le modèle gravitaire
\[
T_{i,j} = \frac {N_{hab, i}\times N_{emp, j}} {f(d_{i,j})}
\]
avec
\[ f=e^{d/\delta} \]
Mais le modèle gravitaire «â¯Ã©craseâ¯Â» lâinformation proprement spatiale et marche surtout «â¯de loinâ¯Â».
Il donne la même valeur à la distance quelque soit la densité du milieu traversé. Or, quand on est isolé, on accepte des distances plus grandes.
On propose dâutiliser une autre analogieâ¯: le modèle radiatif de (Simini et al. 2012) ou des «â¯opportunités intervenantesâ¯Â» de (Stouffer 1940)
Dans cette analogie, au lieu dâavoir des masses qui sâattirent (A et B), le trajet entre A et B est influencé par les Cs que lâon rencontre en chemin.
Analogie physiqueâ¯: une particule est émise dâun point. Elle parcourt lâespace jusquâà rencontrer des sites dâabsorption. A chaque site dâabsorption elle peut être absorbée (probabilité \(p\)) ou continuer (probabilité \(1-p\)).
Mais un milieu linéariséâ¯: au lieu dâune particule partant dans une direction quelconque, on classe sur une droite tous les sites dâabsorption en fonction de leur distance. Ils seront rencontrés dans cet ordre. Ceci permet de représenter lâinfluence de la distance, puisque ce qui est près compte plus que ce qui est loin.
Nous proposons un Modèle Ergodique à Absorption, Priorité et Saturation (/mi:ps/)
Le modèle théorique
Version simple
Priorité et saturation
Ergodicité
Algorithme
Simulations synthétiques pour en étudier les propriétés
Estimations à partir de MOBPRO à La Rochelle
données
\(R^2_{KL}\) et quelques autres éléments
Apprentissage (ou estimation non paramétrique)
Estimations paramétriques
Conclusions
Pourquoi MEAPS�
Modèle Ergodique à Absorption, Priorité et Saturation
Simulations Synthétiques
Estimations
Conclusions
Pour chaque individu, les emplois sont classés dans lâordre des distances, chaque emploi a un rang \(r_i(j)\) et une probabilité dâabsorption uniforme \(p_a\). La probabilité de dépasser au moins \(j\) sâécritâ¯:
\[ \bar F(j)=(1-p_a)^{r_i(j)} \]
On peut définir une fuite, câest-à -dire la probabilité de ne pas sâarrêter dans le périmètre dâétude (fini)
\[ p_a = 1-(p_f)^{1/J} \]
La probabilité de sâarrêter en \(j\) peut alors sâécrireâ¯:
\[ P_i(j) = (1-p_a)^{r_i(j)-1} \times p_a = {p_f}^{\frac {r_i(j)-1} {J}} \times (1-{p_f}^{1/J}) \]
et ne dépend que des paramètres globaux, la fuite et le nombre dâemplois.
On définit lâaccessibilité \(s_i(d)=\sum _{j/d_{i,j}<d}1\)
On a au premier ordre (\(k\) est le nombre dâemploi en \(c_d\), \(\mu=\frac{-log(p_f)}{J})\) :
\[ P_i(i\in c_d) \approx k\times \mu \times e^{-\mu \times s_i(d)} \]
et doncâ¯:
\[ T^{meaps}_{i,j} = \mu \times N_{hab, i}\times N_{emp, j} \times e^{-\mu \times s_i(d)} \]
Si la densité des opportunités (les emplois) est uniforme, on peut calculer \(s_i(d)=r^2/\rho^2\) et (re)trouver une forme «â¯gravitaireâ¯Â» qui dépend de la distance.
\[ T^{meaps}_{i,j} = \mu \times \frac {N_{hab, i}\times N_{emp, j}} { e^{d^2/\rho^2}} \]
Lâabsorption définit une «â¯demandeâ¯Â» quâil faut confronter à des disponibilités. En lâabsence dâun prix nous proposonsâ¯:
En notant \(\phi_u(i,j)\) la probabilité de disponibilité (\(\phi\) vaut 0 si lâemploi est complètement pris)
\[ P_{u, i}(j) = \lambda_{u,i}.\phi_u(i,j). p_a \prod_{l=1}^{r_i^{-1}(j)-1}(1-\lambda_{u,i}. \phi_u(i,r^{-1}(l)).p_a) \]
\[ \prod_{j=i} ^{J} (1-\lambda_{u,i} \times \phi_u(i,j) \times p_{a})= p_f \]
Pour ne pas dépendre dâun ordre particulier, nous faisons la moyenne sur tous les ordres possibles. Aucun résident nâest privilégié, la moyenne sur tous les ordres possibles donne une solution acceptable.
Il y a \(I!\) ordres possibles ce qui est impossible à traiter.
On prend donc un (petit) échantillon de ces ordres et on conjecture lâergodicité du modèleâ¯: un faible nombre de tirages permettra dâatteindre la moyenne sur tous les ordres.
Intuitivement, chaque individu est localisé aléatoirement, la saturation dépend surtout de la coïncidence dâindividus proches dâune opportunité et qui sont donc les premiers servis. Cette coïncidence est rare et donc quelques tirages conduisent à un résultat proche de tous les tirages.
Le modèle nâadmet pas de solution fermée. La simulation est incontournable, notamment pour prendre en compte les données riches géographiques (réseaux de transport, localisation des emplois, des individus).
Lâalgorithme a été implémenté en C++ en utilisant la parallélisation pour le Monte-Carlo avec OpenMP. Avec les optimisations que nous avons réussi à implémenter, pour un problème de la taille de La Rochelle, il faut 20s pour une simulation sur 256 tirages avec 4 threads.
Le code est dans le package R {rmeaps}
github.com/maxime2506/rmeaps
Pourquoi MEAPS�
Modèle Ergodique à Absorption, Priorité et Saturation
Simulations Synthétiques
Estimations
Conclusions
On génère une distribution aléatoire, avec une répartition spatiale des individus, des emplois, des distances et des rangs. On peut simuler le modèle et lâagréger à une maille choisie.
On peut analyser lâergodicité ou définir une tension et plein dâautres choses.
Pourquoi MEAPS�
Modèle Ergodique à Absorption, Priorité et Saturation
Simulations Synthétiques
Estimations
Conclusions
INSEE (2022), fichier détail du recensement. Donne pour chaque commune de résidence, la commune principale dâactivité de chaque résident. On interprète ça comme un flux. 72 communes de résidence, 210 communes dâemploi.
localisation des résidents au carreau 200m (données carroyées de lâINSEE) (5475 carreaux de résidence)
localisation des emplois au carreau 200m (MOBPRO+fichiers fonciers en localisant en fonction des surfaces dâactivité par 5 NAF, à proportion des surfaces de chaque commune) (6236 carreaux dâemplois)
On évalue les distances entre chaque paire de carreau 200m pour 4 modes de transport